While deep learning methods hitherto have achieved considerable success in medical image segmentation, they are still hampered by two limitations: (i) reliance on large-scale well-labeled datasets, which are difficult to curate due to the expert-driven and time-consuming nature of pixel-level annotations in clinical practices, and (ii) failure to generalize from one domain to another, especially when the target domain is a different modality with severe domain shifts. Recent unsupervised domain adaptation~(UDA) techniques leverage abundant labeled source data together with unlabeled target data to reduce the domain gap, but these methods degrade significantly with limited source annotations. In this study, we address this underexplored UDA problem, investigating a challenging but valuable realistic scenario, where the source domain not only exhibits domain shift~w.r.t. the target domain but also suffers from label scarcity. In this regard, we propose a novel and generic framework called ``Label-Efficient Unsupervised Domain Adaptation"~(LE-UDA). In LE-UDA, we construct self-ensembling consistency for knowledge transfer between both domains, as well as a self-ensembling adversarial learning module to achieve better feature alignment for UDA. To assess the effectiveness of our method, we conduct extensive experiments on two different tasks for cross-modality segmentation between MRI and CT images. Experimental results demonstrate that the proposed LE-UDA can efficiently leverage limited source labels to improve cross-domain segmentation performance, outperforming state-of-the-art UDA approaches in the literature. Code is available at: https://github.com/jacobzhaoziyuan/LE-UDA.
translated by 谷歌翻译
最近,我们看到了照片真实的人类建模和渲染的神经进展取得的巨大进展。但是,将它们集成到现有的下游应用程序中的现有网络管道中仍然具有挑战性。在本文中,我们提出了一种全面的神经方法,用于从密集的多视频视频中对人类表演进行高质量重建,压缩和渲染。我们的核心直觉是用一系列高效的神经技术桥接传统的动画网格工作流程。我们首先引入一个神经表面重建器,以在几分钟内进行高质量的表面产生。它与多分辨率哈希编码的截短签名距离场(TSDF)的隐式体积渲染相结合。我们进一步提出了一个混合神经跟踪器来生成动画网格,该网格将明确的非刚性跟踪与自我监督框架中的隐式动态变形结合在一起。前者将粗糙的翘曲返回到规范空间中,而后者隐含的一个隐含物进一步预测了使用4D哈希编码的位移,如我们的重建器中。然后,我们使用获得的动画网格讨论渲染方案,从动态纹理到各种带宽设置下的Lumigraph渲染。为了在质量和带宽之间取得复杂的平衡,我们通过首先渲染6个虚拟视图来涵盖表演者,然后进行闭塞感知的神经纹理融合,提出一个分层解决方案。我们证明了我们方法在各种平台上的各种基于网格的应用程序和照片真实的自由观看体验中的功效,即,通过移动AR插入虚拟人类的表演,或通过移动AR插入真实环境,或带有VR头戴式的人才表演。
translated by 谷歌翻译
关于图像数据的多标签学习已通过深度学习模型广泛利用。但是,对深CNN模型的监督培训通常无法发现足够的判别特征进行分类。结果,提出了许多自学方法来学习更多可靠的图像表示。但是,大多数自我监督的方法都集中在单个标签数据上,并缺乏具有多个对象的更复杂的图像。因此,我们提出了一种对象感知的自学方法(OASS)方法,以获取多标签学习的更细粒度表示,并根据对象位置动态生成辅助任务。其次,可以利用OAS学到的强大表示形式,以无提案方式有效地生成特定于类的实例(CSI),以更好地指导多标签监督信号传递到实例。对多标签分类的VOC2012数据集进行了广泛的实验,证明了该方法针对最先进的对应物的有效性。
translated by 谷歌翻译
越来越多的内容和机构努力使用外部数据来提高AI服务的性能。为了解决数据隐私和安全问题,联合学习吸引了学术界和工业的越来越多的关注,以安全地构建跨多个隔离数据提供商的AI模型。在本文中,我们研究了在现实世界应用中扩展广泛使用的XGBoost模型的效率问题,以垂直联合学习设置。最先进的垂直联合XGBoost框架需要大量的加密操作和密文传输,这使得模型培训比在本地培训XGBoost模型的效率更少。为了弥合这一差距,我们提出了一种新型批量均匀加密方法,以降低加密相关的计算和传输成本。这是通过将一阶导数和二阶导数编码成单个号码以进行加密,密文传输和同型添加操作来实现。可以从编码值的总和同时解码多个一阶导数和二阶导数的总和。我们在批量联合学习的Batchcrypt工作中受到了批量思想,并设计了一种新的批处理方法来解决允许相当数量的负数的限制。所提出的批处理方法的编码过程由四个步骤组成,包括转换,截断,量化和批量,而解码过程包括去量化和移位。通过理论分析和广泛的数值实验证明了我们的方法的优点。
translated by 谷歌翻译
与置换不变的代理框架的合作多元化学习(MARL)在现实世界应用中取得了巨大的经验成功。不幸的是,由于许多代理商的诅咒以及对现有作品中的关系推理的有限探索,对这个MARL问题的理论理解缺乏。在本文中,我们验证了变压器是否实现了复杂的关系推理,并提出和分析了与变压器近似器的无模型和基于模型的离线MARL算法。我们证明,基于模型和基于模型的算法的次级次数差距分别与代理数量分别独立于和对数,这减轻了许多试剂的诅咒。这些结果是变压器的新概括误差结合的结果以及对变压器系统动力学的最大似然估计(MLE)的新分析。我们的基于模型的算法是第一个明确利用代理的置换不变性的可证明有效的MARL算法。
translated by 谷歌翻译
程序文本理解是一项具有挑战性的语言推理任务,需要模型在整个叙事的发展中跟踪实体状态。完整的程序理解解决方案应结合三个核心方面:输入的本地和全局视图,以及对输出的全局视图。先前的方法考虑了这些方面的一个子集,导致精度低或低召回率。在本文中,我们提出了合并的全球和本地信息(CGLI),该新模型构建了实体和时间段意识到的输入表示(本地输入),考虑了整个上下文(全球输入),我们将实体与实体共同模拟实体状态。结构化预测目标(全局输出)。因此,CGLI同时优化了精度和回忆。我们使用其他输出层扩展了CGLI,并将其集成到故事推理框架中。关于流行的程序文本理解数据集的广泛实验表明,我们的模型可以实现最新的结果;故事推理基准的实验显示了我们模型对下游推理的积极影响。
translated by 谷歌翻译
当使用切割和贴子获取复合图像时,前景和背景之间的几何不一致可能会严重损害其保真度。为了解决复合图像中的几何不一致,几项现有作品学会了扭曲前景对象的几何校正。但是,没有注释的数据集导致性能不令人满意和不可靠的评估。在这项工作中,我们为涵盖三个典型应用程序方案的虚拟尝试(Strat)数据集做出了空间转换。此外,以前的作品仅将前景和背景作为输入,而无需考虑它们的相互对应。取而代之的是,我们提出了一个新颖的对应学习网络(CORRELNET),以使用交叉注意图对正面和背景之间的对应关系进行建模,我们可以预测目标坐标,即前景的每个源坐标都应映射到背景上。然后,前景对象的翘曲参数可以从源和目标坐标对派生。此外,我们学习一个过滤面膜,以消除嘈杂的坐标对,以估计更准确的翘曲参数。我们的Strat数据集上的广泛实验表明,我们所提出的CORRELNET对以前的方法更有利。
translated by 谷歌翻译
故障诊断在许多领域至关重要,因为故障可能导致安全威胁或经济损失。在在线服务系统领域中,操作员依靠大量监视数据来检测和减轻故障。快速识别一组基础故障的根本原因指标可以节省大量时间减轻故障。在本文中,我们将根本原因分析问题作为一种新的因果推理任务,称为干预识别。我们提出了一种新型的无监督因果推理的方法,名为基于因果推理的根本原因分析(大约)。核心思想是一个足够的条件,可以使监视变量成为根本原因指标,即,因果关系贝叶斯网络(CBN)中父母的概率分布的变化。在在线服务系统中的应用程序中,大约根据系统体系结构的知识和一组因果假设在监视指标中构建图形。仿真研究说明了大约的理论可靠性。现实世界中数据集的性能进一步表明,大约可以将TOP-1建议的回忆提高到最佳基线方法的25%。
translated by 谷歌翻译
由于计算的未来是异质的,因此可伸缩性是单图超分辨率的关键问题。最近的工作尝试训练一个网络,该网络可以部署在具有不同能力的平台上。但是,他们依靠像素稀疏卷积,这不是硬件友好,并且实现了有限的实际加速。由于可以将图像分为各种恢复困难的斑块,因此我们提出了一种基于自适应贴片(APE)的可扩展方法,以实现更实用的加速。具体而言,我们建议训练回归器,以预测贴片每一层的增量能力。一旦增量容量低于阈值,贴片就可以在特定层中退出。我们的方法可以通过改变增量容量的阈值来轻松调整性能和效率之间的权衡。此外,我们提出了一种新的策略,以实现我们方法的网络培训。我们在各种骨架,数据集和缩放因素上进行了广泛的实验,以证明我们方法的优势。代码可从https://github.com/littlepure2333/ape获得
translated by 谷歌翻译
价值功能的空间是强化学习中的一个基本概念。表征其几何特性可以提供优化和表示的见解。现有作品主要关注马尔可夫决策过程(MDP)的价值空间。在本文中,我们研究了考虑过渡不确定性的更通用的稳健MDP(RMDP)设置的稳健价值空间的几何形状。具体而言,由于我们发现很难直接适应RMDP的先验方法,因此我们从重新审视非持续的情况开始,并引入了一种新的视角,使我们能够以类似的方式表征非稳定和健壮的价值空间。这种观点的关键是将价值空间以州的方式分解成超曲面的工会。通过我们的分析,我们表明稳健的值空间由一组圆锥形超曲面确定,每组都包含所有在一个状态上一致的策略的可靠值。此外,我们发现在不确定性集中仅采用极端点足以确定可靠的值空间。最后,我们讨论了有关强大价值空间的其他一些方面,包括其对多个州的非跨性别和政策协议。
translated by 谷歌翻译